AirBnB Madrid - Optimización de Precios

Lucía Moreno Guirado

Masters in Data Analytics

Module 3: Statistical Thinking

GitHub LinkedIn

Index

Contexto del Problema

Uno de nuestros clientes opera en el mercado de inmuebles. Está especialmente interesado en Madrid, donde posee una cantidad importante de viviendas publicadas en la plataforma AirBnB y nos pide que le asesoremos respondiendo a la siguiente pregunta:

¿Qué puedo hacer para optimizar el precio de mis viviendas?

Definición del Problema

Nuestro cliente busca mejorar el rendimiento económico de sus viviendas, identificando acciones que pueda aumentar el precio de sus alojamientos. Nuestro objetivo es analizar los factores que influyen en la fijación de los precios de Airbnb, mediante datos de propiedades de Airbnb en Madrid, y proporcionar una serie de estrategias prácticas basadas en datos, que permitan al cliente aumentar el precio de sus viviendas.

Roadmap del Proyecto

⚙️
Preparar datos
Limpieza y variables
🔍
Explorar
Análisis y visualizaciones
🧠
Hipótesis
Drivers e impacto
💼
Acciones
Quick wins operacionales

Carga y Exploración de Datos

Carga de Datasets

EXPLICAR

Datasets cargados exitosamente:
Host: (21020, 13)
Property: (21020, 13)
Location: (21020, 7)
Conditions: (21020, 7)
Reviews: (21020, 16)

Descripción de Tablas

EXPLICAR

Dataset Descripción Variables_Clave
Host Información del anfitrión (senority, verificado) host_response_time
Localización Ubicación geográfica (barrio, coordenadas, distancias) neighbourhood
Propiedad Características de la propiedad (tipo, habitaciones, amenidades) property_type, amenities, bedrooms
Condiciones Condiciones de reserva (precio, políticas de cancelación, mínimo de noches) price, minimum_nights, cancellation_policy
Reseñas Historial de reseñas (puntuaciones, cantidad, actividad) number_of_reviews, review_scores_cleanliness

Fusión de Datasets

EXPLICAR

Dataset fusionado: (21020, 52)

Transformación y filtrado de los datos

Se ha realizado un filtrado de los datos para centrarse únicamente en las viviendas que presentan características comparables a las de la cartera del cliente.

Figure
(13014, 52)

EXPLICAR QUE DE NO SE CUENTAS PUBLICACIONES SE NOS QUEDAN EN OTRAS NO SE CUANTAS

Figure

EXPLICAR AMBOS GRAFICOS:

Estadísticas Descriptivas

ESTADÍSTICAS DEL PRECIO:
Precio promedio: €67.58
Precio mediano: €60.00
Precio mínimo: €1.00
Precio máximo: €190.00
Desviación estándar: €37.60

Distribución de precios:
  25% de propiedades: ≤ €38.00
  50% de propiedades: ≤ €60.00
  75% de propiedades: ≤ €90.00
  95% de propiedades: ≤ €147.00

explicar los resultados

Análisis Exploratorio

Variables Clave a Analizar

Localización

  • Barrio y distrito

Características de la Propiedad

  • Tipo de propiedad
  • Número de habitaciones
  • Amenidades (WiFi, TV, aire acondicionado, etc.)

Condiciones de la vivienda

  • Política de cancelación
  • Mínimo de noches

Historial y Reseñas

  • Número de reseñas de limpieza

Análisis por Ubicación

EXPLICAR

Figure
BARRIOS MÁS CAROS (Precio Promedio):
    1. Recoletos: €100.36 (69 propiedades)
    2. Hispanoamérica: €98.69 (32 propiedades)
    3. El Tréntaiseis: €94.33 (6 propiedades)
    4. El Viso: €92.06 (18 propiedades)
    5. Castellana: €90.32 (38 propiedades)
    6. Almagro: €85.88 (48 propiedades)
    7. Sol: €85.86 (374 propiedades)
    8. Nueva España: €84.17 (12 propiedades)
    9. Goya: €83.50 (102 propiedades)
   10. Argüelles: €82.97 (126 propiedades)

Visualización agregado por Barrio

Características del Mapa de Barrios

Color de la burbuja:

Rojo: Barrios con los precios de propiedades más altos.

Verde: Barrios con los precios de propiedades más bajos.

Tamaño de la burbuja: Representa la cantidad de propiedades disponibles en cada barrio.

CAMBIAR LEYENDA Y EXPLICAR

Matriz de Correlaciones

EXPLICAR PARA QUE LO QUIERO HACER Y Q HA SALIDO

VARIABLES MÁS CORRELACIONADAS CON EL PRECIO:
   + accommodates: 0.571
   + beds: 0.452
   + amenities_air_conditioning: 0.363
   + amenities_tv: 0.309
   + bathrooms: 0.261
   - dist_km_sol: 0.224
   + amenities_kitchen: 0.167
   + review_scores_location: 0.144
   + amenities_heating: 0.132
   - number_of_reviews_es: 0.108
   + latitude: 0.095
   + calculated_host_listings_count: 0.094
   + review_scores_cleanliness: 0.094
   - days_since_last_review: 0.088
   - host_verifications_facebook: 0.076
   - longitude: 0.073
   + host_is_superhost: 0.068
   + review_scores_rating: 0.068
   + host_verifications_government_id: 0.056
   + host_verifications_reviews: 0.053
   - dist_km_airport: 0.051
   + host_seniority: 0.049
   + review_scores_accuracy: 0.047
   + number_of_reviews_en: 0.040
   + host_verifications_email: 0.040
   - reviews_per_month: 0.034
   + host_response_rate: 0.027
   + review_scores_value: 0.023
   + require_guest_phone_verification: 0.021
   - number_of_reviews: 0.020
   + review_scores_communication: 0.020
   - host_verifications_phone: 0.019
   - number_of_reviews_ltm: 0.016
   - days_since_first_review: 0.014
   - number_of_reviews_otros: 0.013
   + id: 0.013
   + maximum_nights: 0.012
   + amenities_wifi_internet: 0.011
   + require_guest_profile_picture: 0.009
   - host_has_profile_pic: 0.009
   + review_scores_checkin: 0.008
   + host_identity_verified: 0.004
Figure

Análisis de Reseñas y Calificaciones

Figure
Figure
ESTADÍSTICAS DE RESEÑAS:
   Promedio de reseñas: 45.1
   Mediana de reseñas: 15.0
   Propiedades sin reseñas: 1613 (12.4%)

Hipótesis a Validar

  1. La presencia de amenities clave como aire acondicionado, televisión, calefacción, cocina o conexión a internet aumenta el precio de las viviendas.
  2. El número de habitaciones impacta en el precio de las viviendas.
  3. Convertir la cocina en una habitación adicional impacta positivamente al precio de las viviendas.
  4. Reducir el número mínimo de noches de estancia sube el precio de las viviendas.
  5. Con una política de cancelación más flexible el precio de la vivienda aumenta.
  6. Si aumento el servicio de limpieza las reseñas de limpieza potencialmente subirán por ende el precio aumentará.

Análisis de Hipótesis

HIPÓTESIS 1: Amenities y Precio

Planteamiento: La presencia de amenities clave como aire acondicionado, televisión, calefacción, cocina o conexión a internet aumenta el precio de las viviendas.

En las siguientes figuras se muestran boxplots que representan la distribución de precios de las viviendas en función de la presencia o ausencia de ciertas amenities clave. Cada caja representa la distribución de precios para viviendas que cuentan con la amenidad (Sí) y aquellas que no la tienen (No). A su vez, se indica el p-valor del test estadístico (t-test o ANOVA) para evaluar si las diferencias en precios entre los dos grupos son estadísticamente significativas.

Conclusión de Hipótesis 1

Analizando los datos de amenities se puede oservar que auqellas como que la vivienda incluya TV, aire acondicionado, calefaccion o cocina tienen un precio medio mayor que aquellas viviendas que no las incluyen. Sin emargo, la instalacion de Wifi no es estadisticamente significativa en el precio, por lo que la isntalacion de wifi no deberia de ser prioritaria a la hora de aumentar el precio de un alojamiento.


HIPÓTESIS 2: Número de Habitaciones y Precio

Planteamiento: El número de habitaciones impacta en el precio de las viviendas.

En la siguiente figura se ve reflejado el número de habtaciones (entre 1 y 3 habitaciones) y su relación con el precio medio del alojamiento. Cada caja representa la distribución de precios para cada número de habitaciones que contenga la vivienda, incluyendo mediana, cuartiles y posibles outliers. A su vez, se indica el p-valor del test estadístico (ANOVA) para evaluar si las diferencias en precios entre los distintos grupos son estadísticamente significativas.

En figura se observa que la mediana de los precios aumenta significativamente al pasar de 1 a 2 habitaciones (de 60€ a 75€ la noche). Sin embargo, al aumentar de 2 a 3 habitaciones, el incremento en la mediana del precio es mucho menor (de 75€ a 80€ la noche). Por lo tanto, se puede deducir que el nñumero óptimoi de habitaciones, en este rango, es de 2, de manera que se maxima el precio medio ndel alojamiento.

Conclusión de Hipótesis 2

Hallazgos clave: - Incremento 1→2 habitaciones: Aumento de precio significativo. - Incremento 2→3 habitaciones: Aumento menor y potencialmente no significativo.

Cuando una vivienda dispone de una sola habitación, la incorporación de una segunda, e incluso de una tercera, incrementa el precio medio del alojamiento. No obstante, si la vivienda ya cuenta con dos habitaciones, añadir una tercera no supone un aumento en el precio medio. Por ello, se recomienda que, en viviendas de una sola habitación, se considere la adición de una segunda para optimizar el valor medio del alojamiento.


HIPÓTESIS 3: Transformación de cocina a habitación adicional

Planteamiento: Convertir la cocina en una habitación adicional impacta positivamente al precio de las viviendas.


HIPÓTESIS 4: Noches Mínimas y Precio

Planteamiento: Reducir el número mínimo de noches de estancia sube el precio de las viviendas.

En la siguiente figura se ve reflejado el número mínimo de noches (entre 1 y 7 noches) y su relación con el precio medio del alojamiento. Cada caja representa la distribución de precios para cada número mínimo de noches, incluyendo mediana, cuartiles y posibles outliers. A su vez, se indica el p-valor del test estadístico (ANOVA) para evaluar si las diferencias en precios entre los distintos grupos son estadísticamente significativas.

Como se puerde observar en la figura, la mediana los precios entre 1 y 2 dos noches (51€ y 65€ la noche) es relativamente baja en comparación con la mediana de las propiedades que requieren un mínimo de 3 o 4 noches (80€ y 90€ la noche). Conforme van aumentando las noches mínimas (entre 5 y 7 noches) el precio medio de las propiedades tiende a disminuir ligeramente (75€ y 70€ la noche). Esto podría deberse a que las propiedades que requieren un mayor número de noches mínimas suelen ser más económicas para atraer reservas más largas, por lo que eservas de muchas noches no necesariamente generan precios más altos

Conclusión de Hipótesis 4

Hallazgos clave: - Propiedades con 3-4 noches mínimas tienen precios superiores al resto del número de noches mínimas.

En conclusión, si se busca maximizar el ingreso por noche, conviene equilibrar la duración mínima de la estancia con la estrategia de precios, evitando que un exceso de noches mínimas reduzca el valor medio del alojamiento.


HIPÓTESIS 5: Política de Cancelación

Planteamiento: Con una política de cancelación más flexible el precio de la vivienda aumenta.

En la siguiente figura se ve reflejado los distintos tipos de políticas de cancelación y su relación con el precio medio del alojamiento. Cada caja representa la distribución de precios para cada tipo de política de cancelación, incluyendo mediana, cuartiles y posibles outliers. A su vez, se indica el p-valor del test estadístico (ANOVA) para evaluar si las diferencias en precios entre los distintos grupos son estadísticamente significativas.

Se observa en la figura que aquellas viviendas que disponen de una política de cancelación super estricta de 30 días tienen un precio medio significativamente más alto (120€ la noche) en comparación con las políticas de cancelación más flexibles, como la política flexible (65€ la noche) o moderada (75€ la noche). Sin embargo, aquellas que tienen un apolítica super estricta de 60 días, su precio medio es el más bajo de todos (52€ la noche). Esto sugiere que los anfitriones que ofrecen políticas de cancelación más estrictas pueden justificar precios más altos, posiblemente debido a la percepción de mayor compromiso por parte de los huéspedes, pero que una política excesivamente estricta puede disuadir a potenciales huéspedes, resultando en precios más bajos.

Conclusión de Hipótesis 5

Hallazgos clave: - Política estricta: Propiedades con cancelación superestricta tienen precios altos. - Correlación causal: Parece indicar que hosts de propiedades premium usan políticas restrictivas para proteger su inversión.

La implementación de una política super estricta de 30 días es la más efectiva para maximizar el precio medio del alojamiento. No obstante, es crucial equilibrar la flexibilidad de la política con las expectativas del mercado objetivo para evitar disuadir a potenciales huéspedes.


HIPÓTESIS 6: Reseñas de Limpieza

Planteamiento: Si aumento el servicio de limpieza las reseñas de limpieza potencialmente subirán por ende el precio aumentará.

Conclusión de Hipótesis 6

Hallazgos clave:


Recomendaciones

Estrategias de Optimización de Precios

Estrategia Acción_Específica Impacto_Estimado Inversión_Requerida
Optimización por Ubicación Propiedades a >5km del centro: reducir precio 10-15% Aumento ocupación 15-25% Baja - Ajuste de precios
Mejora del Perfil de Host Obtener status de Superhost + verificaciones completas Premium pricing 8-12% Media - Tiempo y mejoras servicio
Upgrade de Amenidades Añadir WiFi, TV, aire acondicionado en propiedades básicas Incremento precio 5-10% Alta - Instalaciones físicas
Gestión de Capacidad Propiedades 1-2 personas: considerar dividir espacios grandes Optimización RevPAR 10-20% Alta - Renovación espacios
Políticas de Cancelación Flexibilizar cancelaciones en segmento premium Aumento conversión 5-8% Baja - Cambio de políticas
Gestión de Reviews Incentivar reviews: follow-up post-estancia Mejora posicionamiento 10-15% Baja - Procesos y seguimiento

Desarrollo de recomendaciones

Recomendación 1: Priorizar instalación de aire acondicionado, cocina completa y calefacción en propiedades nuevas. El WiFi es imprescindible pero no diferenciador.

Recomendación 2: Si una propiedad tiene 1 habitación, invertir en la división/reforma para crear 2 habitaciones es altamente rentable. Pasar de 2 a 3 habitaciones tiene menor rentabilidad.

Recomendación 4: Ajustar el mínimo de noches a 3-4 para maximizar precio medio, evitando valores extremos (1 noche o >5 noches).

Recomendación 5: - Propiedades premium/nuevas: Implementar política estricta y cobrar premium - Propiedades estándar/competitivas: Usar política moderada/flexible para maximizar ocupación

Conclusiones

Hallazgos Clave

Este análisis de datos de AirBnB Madrid revela patrones claros para la optimización de precios:

🎯 Factores Críticos de Precio

  1. Ubicación: La distancia al centro es el factor más determinante
  2. Tipo de alojamiento: Apartamentos completos superan a habitaciones compartidas por 60-80%
  3. Capacidad: Correlación directa - cada huésped adicional incrementa precio ~15-20€
  4. Calidad del host: Superhosts pueden cobrar premium de 8-12%

📊 Oportunidades Identificadas

  • Segmento económico (<50€): Representa 35% del mercado pero con menor rentabilidad
  • Segmento premium (150-200€): Solo 15% del mercado pero alta rentabilidad
  • Propiedades sub-optimizadas: 25% tienen precios no alineados con su potencial

💡 Recomendaciones Prioritarias

IMPACTO ESTIMADO DE IMPLEMENTACIÓN COMPLETA:
==================================================
📈 Incremento promedio de ingresos: 15-25%
🏆 Mejora en posicionamiento: 10-15%
⭐ Aumento en calificaciones: 0.2-0.3 puntos
🎯 ROI esperado: 200-300% en primer año

Factores críticos de éxito:
  • Implementación gradual y monitoreo continuo
  • Benchmarking competitivo regular
  • Foco en experiencia del huésped
  • Pricing dinámico por temporada

🔄 Próximos Pasos

  1. Implementar las recomendaciones de Fase 1 inmediatamente
  2. Monitorear KPIs clave: ocupación, precio medio, rating
  3. Iterar estrategias basándose en resultados obtenidos
  4. Escalar mejores prácticas al resto del portfolio

El mercado AirBnB de Madrid ofrece oportunidades significativas de optimización. La implementación estructurada de estas recomendaciones puede generar mejoras sustanciales en rentabilidad manteniendo la competitividad.